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不 完备 信息 系统 确定 性 和 集 对 联系 度 的 粗 集 拓展 模型 


李 长 清 !， 李 克 典 2?， 李 进 金 ? 
(1- 汕头 大 学 理学 院 ， 汕 头 515063; 2- 漳州 师范 学 院 数学 与 信息 科学 系 ， 漳 州 363000) 
摘 E 本 文 把 集 对 分 析 的 思想 融入 不 完备 信息 系统 确定 性 理论 之 中 ， 得 到 了 更 广泛 的 拓展 模型 ， 它 是 通 
过 调整 参数 ， 达 到 对 系统 的 理想 分 类 。 这 种 模型 既 保 留 了 已 有 的 拓展 模型 的 优点 ， 又 克服 了 它们 
的 局 限 性 ， 为 处 理 不 完备 信息 系统 提供 了 一 种 有 效 的 方法 。 
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粗 集 理论 是 是 近年 来 发 展 起 来 的 一 种 新 的 处 理 不 确定 性 和 不 完整 知识 的 数学 工具 ， 已 被 广 
泛 应 用 于 决策 与 分 析 、 模 式 识 别 和 数据 挖掘 23] 等 领域 。 经 典 的 粗 集 理论 处 理 的 是 完备 的 信息 
系统 ， 而 在 现实 应 用 中 ， 由 于 对 数据 获取 的 限制 ， 使 得 大 量 的 数据 缺失 或 不 确定 ， 从 而 信息 系 
统 都 不 完备 。 因 此 ， 对 经 典 的 粗 集 理论 进行 必要 的 拓展 成 为 人 们 研究 的 一 个 热门 课题 ， 现 已 有 
了 许多 广泛 拓展 。 主 要 有 基于 容 差 关 系 和 由、 相似 关系 回 和 限制 容 差 关系 回 的 粗 集 拓展 模型 ， 它 
们 在 不 完备 信息 系统 的 处 理 中 各 自 具 有 明显 的 特征 ， 但 这 些 拓展 模型 也 都 存在 一 定 的 局 限 性 。 

赵 克 勤 教授 提出 的 集 对 分 析 方 法 (SPA)D 是 一 种 用 于 研究 集合 之 间 相互 联系 的 新 理论 ， 现 
已 得 到 广泛 的 应 用 。 黄 兵 图 针对 以 上 几 种 粗 集 拓 展 模 型 的 局 限 性 ， 运 用 集 对 分 析 方法 对 它们 进 
行 改 进 ， 得 到 更 好 的 拓展 模型 。 随 后 ， 刘 富 春季 做 进一步 的 拓展 。 但 以 上 进一步 拓展 的 模型 仍 
存在 局 限 性 ， 它 们 只 能 解决 某 一 层次 的 问题 ， 对 于 复杂 的 不 完备 信息 系统 不 能 很 好 的 处 理 。 本 
文 把 集 对 分 析 的 思想 融入 不 完备 信息 系统 确定 性 理论 中 ， 通 过 引入 参数 对 以 上 的 粗 集 模型 进 一 
步 拓展 ， 得 到 了 更 广泛 的 拓展 模型 。 它 是 利用 调整 参数 ， 达 到 对 系统 的 理想 分 类 ， 既 保留 了 前 
面 几 种 拓展 模型 的 优点 ， 又 克服 了 它们 的 局 限 性 ， 最 后 举 一 个 实例 进行 分 析 。 


2 ” 几 种 已 有 粗 集 拓 展 模型 


给 定 不 完备 信息 系统 5 = (U, 4)， 其 中 也 是 论 域 ，4 是 有 限 非 空 属 性 集 ， 对 任意 的 ae 4， 
fa:U 一 Va，V 为 a 的 值 域 ，* 表示 不 确定 或 已 丢失 的 属性 值 。 
XEX.2.1U] R (U, A) 是 不 完备 信息 系统 ，B C 4， 容 差 关 系 卫 定义 为 


Tg = (zy) €U xU | Va € B, a(z) = «Va(y) = * V a(z) = a(y)}. 


4 Ta(z) = {y EU | (x. y) € Tpj- 
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EN 2.25) i$ (U, A) 是 不 完备 信息 系统 ，B C A， 非 对 称 相似 关系 5S 定义 为 
Sg = ((z,y) EU xU |Ya €B, a(z) = «va(z) = a(y))}. 
XEX.2.319 ig (U, 4) 是 不 完备 信息 系统 ，B C 4， 限 制 容 差 关系 也 定义 为 
Ls = {(£,4) € U x U | Y a € Bla(z) = a(y) = +) 


V(Pp(z) N Pa(y) # Ø ^V a € B((a(z)  * ^a(y) # *) — a(x) = aly)))}, 


Jt Ps(z) = {a € B | a(x) # *}e *Ls(z) = {y € U | (x,y) € Lg} 

容 差 关系 和 非 对 称 相似 关系 是 对 完备 信息 系统 下 等 价 关系 的 两 种 拓展 ， 它 们 是 两 个 极端 情 
形 ， 前 者 相对 宽松 ， 而 后 者 又 相对 紧凑 。 限 制 容 差 关系 刚好 介 于 这 两 者 之 间 ， 比 较 好 地 体现 了 
优越 性 。 但 它 仍 存在 不 足 ， 对 于 个 体 之 间 只 要 有 一 个 属性 值 不 同 (如 z = (0,1,2, ,99) 5 y = 
(1,1,2, ,99)) 就 看 作 不 同 ， 被 划 在 不 同类 中 ， 这 会 导致 知识 库 划 分 过 细 ， 不 利于 对 系统 的 处 
理 。 文 献 [9] 定义 的 集 对 (a,6) 容 差 关系 ， 通 过 对 集 对 联系 度 的 调节 ， 达 到 对 系统 灵活 有 效 地 处 
理 ， 苑 服 了 以 上 不 足 

定义 2.49 Wr (U, A) 是 不 完备 信息 系统 ，B C 4。 对 任意 的 z, y EU, zx 与 y 在 B 下 的 集 
对 联系 度 UBp(z,y) 定义 为 

Up(z,y) = $1 + $2i + $3j, 
XES = |M(zx,y)|/n 称 为 x,y 在 B 下 的 同一 度 ，52 = |N(zx,2)|/n 称 为 x,y 在 B 下 的 对 立 
度 ，S3 = |K(x,y)|/n 称 为 z,y 在 BB 下 的 差异 度 ，n = |B|。 其 中 


M(z,y) = (a € B | a(x) £ *^a(y) # * A a(x) = a(y)}, 
N(z,y) = (a € B | a(x)  *^a(y)  * ^ a(x) * a(y)); 
K(z,y) = (a € B | a(z) = *va(y) = *}. 
XEXL2.5U! Wb (U, A) 是 不 完备 信息 系统 ，B C A. SEXE (a, 8) 容 差 关系 SP(a, B) 定义 为 
SPp(o,8) = ((z,y) EU xU | Us(z, y) = S1 + Sai + Sa^ $1 > a ^82 <B UP 


Hp I = {(x,x)|£ Ee U}e $SPs(o,8)(x) = (y € U | (z,y) € SPs(o,8))- 

容 差 关系 ， 限 制 容 差 关 系 和 集 对 (a, 6) 容 差 关系 对 属性 值 有 明确 相同 的 个 体 都 有 各 自 
的 归属 ， 而 对 没有 一 个 明确 相同 的 个 体 归 属 都 存在 片面 性 。 例 如 对 z = (12, ,*),， y= 
Gros vx), z m (x, k, k) RERRUN r, y, z 不 可 分 辨 ， 限 制 容 差 关 系 认为 z 与 y 可 
4 HH. y 与 z 不 可 分 辨 ， 集 对 容 差 关系 认为 m, y, z 两 两 可 分 辨 ， 这 就 与 实际 不 相符 。 鉴 于 以 上 
局 限 性 ， 以 下 结合 集 对 分 析 思 想 与 对 象 属性 值 联合 确定 率 这 个 概念 ， 提 出 一 种 不 完备 信息 系统 
确定 性 和 集 对 联系 度 的 粗 集 拓展 模型 。 


3 ”确定 性 和 集 对 联系 度 的 粗 集 拓展 模型 
定义 3.109 设 (U, A) 是 不 完备 信息 系统 ，B C 4， 对 任意 的 z, y € UU， 对象 xz,y 属 性 值 联 
EMER F(E y) 定义 为 
1, T = Y, 


PED) Pala) + [PaL 


2|B]| tuy 
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其 中 Pp(z) = (be B|b(z) Z«), B00 < F(z,y) € 1. 
定义 3.2 W(U, 4) 是 不 完备 信息 系统 , BC A, 0 < ab,7 < 1， 确 定 集 对 容 差 关 
系 J(a, B, y) 定义 为 
Jp(o, b,7Y) = {(£,y) €U xU |Up(z, y) = Sı + Soi + S3j 
A((S1 > aA S2 € B) V (S3 = 1A F(z,y) 2 7))} UZ, 


这 里 了 = {(z,z)|zez。 显 然 y(a,6,7) 满 足 自 反 性 和 对 称 性 ， 但 不 满足 传递 性 。z 的 确定 集 
对 容 差 类 为 Jp(a,B,7Y)(z) = (y EU | (xy) € Jala, 8, ))- 
对 任意 的 和 CU, X FD (Xg) 和 上 近似 (XP) 为 
Xj = {x € U | Jala, b, y£) c X}, X? = {z €U | Jgla, b, y2) N X z Ø}. 


定理 3.1 S= (U, 4) 为 不 完备 信息 系统 ，Ja(a,B,7Y) 为 确定 集 对 容 差 关系 ， 则 

1 ?3aoa--—y-0Hf, Jala, B, y) = Ta: 

2) UM0.5«-« 1H]. Jala, B, y) = SPa(a, 8): 

3) SDUHEIEHIrcCU,P(z)Zz0,.W4o0-28-—0,05«yz1H,. Ja(o,B, y) = La. 

此 定理 表明 ， 确 定 集 对 容 差 关系 是 容 差 关系 、 限 制 容 差 关系 以 及 集 对 (a,b) 容 差 关系 的 推 


Fe 
KS = (U, A) 是 不 完备 信息 系统 ，X, YC U,，B C 4A。 从 定义 3.2 可 以 直接 得 到 确定 性 和 和 集 


对 联系 度 的 粗 集 上 、 下 近似 的 如 下 性 质 。 
性 质 3.1 xicXcxP, Ø =Ø, U -U. 
性 质 3.2 车 XCY, 则 Xj CYy, XP c YF. 
性 质 3.3 (XO Y) = XSNYS, (XUY)? = XP UYP., 
性 质 3.4 (XNY)? c XP nYP, (XUY) 2 XL UYY, 
性 质 3.5 (X$8)8 CXR E(X)? € X C(XF)B € X7 € X7). 
性 质 3.6 WX,Y CU, WX CY] e xP? cy. 


4A 实例 分 析 
设 不 完备 信息 系统 3 = (U, A)， 其 中 论 域 U = {fzl,zaz,zsz4,z5,z6} 表 示 6 个 家 庭 调 查 
对 象 ， 属性 集 4 == {a1, a2, 03, 04, 05, 06, A7, G8); al 表示 住房 大 与 小 ， a: 表示 房价 贵 与 便 
宜 ，as 表示 住房 装修 与 未 装修 ，a4 表示 住房 周边 环境 好 与 坏 ，as 表示 住房 楼 层 高 与 低 ，ae 表 
示 住 房 质量 好 与 坏 ，a7 表示 住房 新 与 旧 ，ag 表示 住房 远 与 近 ，Vi = {1,0} (i = 1,2,… ,8)， 如 
x1. 
下 面 用 容 差 关系 分 析 这 个 信息 系统 。 
7T4(Z1) S TA(x2) T (2122,23, T4, T6, h 
TA(za) = TA(z4) = TA(ze) = (21, 22, 3, £4, 15, T6}, 


TA(zs) - (za, T4, T5, £6}. 


在 这 种 分 类 中 ，z2 只 有 两 个 属性 值 不 是 空 值 ，zs 属性 值 都 是 空 值 ， 认 为 它们 不 可 分 辨 导致 
了 系统 划分 过 粗 ， 不 利于 对 系统 的 处 理 ， 还 有 如 za 与 me, zs 与 z6 等 都 有 类 似 情况 。 


第 2 期 李 长 清 等 ; 不 完备 信息 系统 确定 性 和 集 对 联系 度 的 粗 集 拓展 模型 345 


表 1: 住房 条 件数 据 表 


U Ql a2 a3 a4 a5 a6 ar as 
Zi 1 1 0 1 1 1 * 0 
T2 * * 0 * * * * 0 
T3 * * * * * * * * 
T4 1 * * * * 1 0 0 
T5 1 0 1 0 0 1 0 0 
xe * * * * * * * * 


下 面 用 限制 容 差 关系 分 析 这 个 信息 系统 。 
Lalzı) = La4(z2) = {21, x2,74}, Lalz3) = LA(zxe) = 123,26], 
工 4(z4) = (21,22, 74, £5}, LA(zs) = (24,25). 


在 这 种 分 类 中 ，zs 只 有 两 个 属性 值 不 是 空 值 ，za 属性 值 都 是 空 值 ， 认 为 它们 可 分 辨 ， 
而 zs 与 ze 都 是 空 值 却 认为 不 可 分 辨 ， 这 与 实际 很 不 相符 。 
最 后 ， 用 集 对 (o, B) 容 差 关系 分 析 这 个 信息 系统 ， 取 w = 1, p= h 


SPa(z1) = (zi, z4}, SPa(z2) = {z2}, SPA(z3) = {z3}, 
SPa(r4)- {£1, £4, £5}, SPa4(z5) = (x4, 5), SPal(ze) = (xe). 


在 这 种 分 类 中 ，zs 属性 值 都 不 是 空 值 ，zs 属性 值 都 是 空 值 ， 认 为 它们 可 分 辨 导致 了 系统 划 
分 过 细 ， 也 不 利于 对 系统 的 处 理 。 
与 以 上 对 比 ， 用 确定 集 对 容 差 关系 分 析 这 个 信息 系统 ， 取 a= 4, L=, 7e 


Ja(zı) = (zi zaz4Z6}， Jalz2) = {z2}, JA(xa) = (x1, 23, £5}, 
Ja(z4) = (zíi,r4,25), J4(z5) = {£3, £4, £5, £6}, Ja(ze) = {21, £5, re}. 


用 这 种 关系 分 类 ， 更 为 实际 有 效 且 完全 克服 了 以 上 几 种 关系 的 局 限 性 。 


5 ”结束 语 


本 文 把 集 对 分 析 的 思想 融入 不 完备 信息 系统 确定 性 理论 中 ， 得 到 更 广泛 的 不 完备 信息 系统 
的 粗 集 拓展 模型 。 这 种 模型 可 根据 实际 应 用 的 需要 ， 对 参数 a, B, Y 合 理 的 调节 ， 从 而 达到 对 
更 广泛 的 不 完备 信息 系统 的 有 效 处 理 ， 既 保留 了 已 有 几 种 拓展 模型 的 优点 ， 又 克服 了 它们 的 局 
限 性 。 
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Abstract: In view of the limitations in the existing extensions of rough set, this paper proposes a 
novel extension. By unifying determinism of incomplete information systems and set-pair analysis, we 
attain a better classification. The extension provides an effective method for incomplete information 


Systems. 
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